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(57) La presente invention concerne un environnement a 
sTsteme de calcul multitache. 

Le processeur (202) demande a un coprocesseur (204) 
de commuter le contexte approprie pour determiner le pro- 
gramme d'execution, le coprocesseur (204) repond en ar- 
retant I'execution du programme et en ne sauvegardant 
que la quantite minimale d'informations d'etat de proces- 
seur necessaire pour une restauration avec succes du pro- 
gramme. Le point approprie est choisi par le programmeur 
d'application a en emplacement du programme d'execution 
qui exige de preserver une partie minimale d'informations 
de processeur aux bornes de la commutation de contexte. 

Et ne sauvegardant qu'une quantite minimale d'informa- 
tions de processeur, on accumule des economies de 
temps de processeur aux bornes des operations de sauve- 
garde et de restauration de contexte. 
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La presente invention concerne des systemes de 
calcul et plus particulierement des operations de 
commutation de contexte dans un environnement multi-tache 
ayant par exemple une architecture a multiprocesseurs . 
5 Un environnement multi-tache implique de maniere 

generale 1 1 execution concomitante de plusieurs programmes 
dans un ordinateur, par exemple, une execution de 
programmes a decoupage du temps. Les utilisateurs de 
1' ordinateur ont 1 ' impression que les programmes sont 

10 executes en parallele alors qu'en realite 1" ordinateur 
commute entre les programmes. Lorsque 1 ' execution d'un 
programme est a decoupage du temps, un programme est 
execute pendant une periode de temps avant d'etre "a 
commutation de contexte" (commutation de tache) pour 

15 executer un autre programme. 

Lors de la reprise d'un programme a commutation de 
contexte, le programme devrait reprendre 1' execution a 
1 1 emplacement precis ou 1' execution a ete prealablement 
terminee. En anticipation de la reprise ulterieure du 

20 programme a commutation de contexte, un processeur 
effectue un processus de sauvegarde de l'etat du 
programme qui etait a commutation de contexte avant le 
chargement et 1' execution d'un autre programme par le 
processeur. Cet etat de programme est represente dans 

25 divers emplacements memoire par l'etat du processeur 
lorsque le programme est a commutation de contexte. 

La commutation de contexte est transparente au 
programmeur du programme a commutation de contexte parce 
que, du point de vue du programmeur, la commutation de 

30 contexte se produit a des temps arbitraires et ainsi a 
des emplacements arbitraires du programme. Supplemen- 
tairement, le systeme de fonctionnement qui met en oeuvre 
la commutation de contexte ne connait pas 1 ' etat du 
programme dont le contexte a ete commute. II en resulte 

35 que toutes les informations d'etat du processeur doivent 
etre sauvegardees lorsque le programme est commute en 
contexte. Les informations d'etat du processeur 
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comprennent tous les registres visibles d ' architecture et 
de logiciel ainsi que tous emplacements memoire qui sont 
etablis a des adresses connues seulement a l'interieur du 
processeur telles qu'une memoire de travail. 
5 Pour une architecture de processeur presentant une 

grande quant ite d ' informations d'etat, le procede 
traditionnel de commutation de contexte de programme 
impliquant la sauvegarde et la restauration de toutes les 
informations d'etat du processeur est inefficace et peut 

10 avoir un impact negatif sur les performances du 
processeur. L' inef f icacite et 1 ' impact de performance 
negatif associe a la commutation de contexte doit etre 
attribue en partie a des operations de processeur qui 
necessitent d'acceder a des emplacements de memoire 

15 multiples affectes a la mise en memoire des informations 
d'etat du processeur et a des operations qui enregistrent 
les informations d'etat du processeur aux bornes de bus 
de relativement faible largeur de bande vers d'autres 
emplacements memoire. Cette meme inef f icacite de la 

20 commutation de contexte de type conditionnel a egalement 
un impact negatif sur les performances du processeur au 
cours du processus de restauration de programme lorsque 
1' ensemble des informations d'etat de processeur mises en 
meoire est trans fere en retour vers les emplacements 

25 memoire affectes a l'etat des informations de processeur. 
Cette inefficacite est accumulee au cours de chaque 
commutation de contexte de programme. Par exemple, une 
architecture a processeur de signaux multimedia peut 
avoir un etat de processeur represente par plus de 7 

30 kilo-octets d ' informations dans plus de cent (100) 
registres et emplacements memoire. Chaque commutation de 
contexte necessite de maniere traditionnelle de 
transferer 1' ensemble de ces informations vers un 
emplacement de mise en memoire d'etat de processeur. 

35 La reduction des impacts negatifs de performances 

qui sont associes a la commutation de contexte dans un 
systeme multi-tache, tel qu'un systeme multimedia 
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employant un processeur de signaux multimedia, reduit de 
maniere avantageuse les retards indesirables entre 
1' execution des programmes. Ceci peut etre 
particulierement sensible lorsque des programmes sont 
5 impliques dans le traitement de grandes quantites 
d 1 informations tel que dans un environnement de 
traitement multimedia. 

La presente invention reduit de maniere avantageuse 
la quantite de temps de processeur necessaire pour la 

10 commutation de contexte entre programmes. Certains points 
dans un programme au cours de commutation de contexte 
necessitent une mise en memoire de plus d' informations 
d'etat de processeur de maniere a reprendre avec succes 
1' execution du programme plus tard que d'autres points. 

15 Dans un mode de realisation de la presente invention, une 
architecture a multiprocesseurs permet a un processeur de 
requerir 1' execution d'un programme en cours par un 
processeur pour s 1 interrompre lui-meme a un point 
approprie en anticipation de la commutation de contexte 

20 du programme en cours. Le point approprie correspond a un 
point du programme en cours d' execution qui peut reduire 
la quantite d' informations d'etat de processeur 
necessaire, pour reprendre avec succes le programme de 
commutation de contexte et peut ne pas suivre 

25 immediatement la reception de la requete de commutation 
de contexte. 

Dans un autre mode de realisation de 1" invention, 
les responsabilites pour les fonctions de sauvegarde et 
de restauration de contexte dans un environnement multi- 

30 tache sont attributes entre un processeur et le programme 
d' application en cours d' execution. Dans ce mode de 
realisation, le programme est marque, par exemple avec 
une inscription de programme de commutation de contexte 
conditionnel, dans des emplacements multiples 

35 correspondant a des points du programme requerant une 
quantite reduite d ' informations d'etat de processeur pour 
reprendre avec succes 1' execution du programme. Lorsque 
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le programme atteint 1 ' emplacement marque et qu'une 
requete de commutation de contexte a ete regue et 
detectee, le programme declenche une reponse pour mettre 
en memoire seulement les informations d'etat de 
5 processeur necessaires pour une reprise avec succes du 
programme. Le programme devrait etre marque de maniere 
suffisamment frequente pour eviter tout retard notable 
entre 1' excitation d'une requete de commutation de 
contexte et une commutation de contexte en reponse. 

10 Dans un autre mode de realisation, la presente 

invention est un procede comprenant les operations 
consistant a executer un premier programme sur un premier 
processeur, a recevoir une requ§te de commutation de 
contexte d'un second processeur, et a repondre a la 

15 requete de commutation de contexte au niveau d'un point 
approprie du premier programme, dans lequel le point 
approprie est associe a un repere dans le programme qui 
indique un point approximatif du premier programme 
requerant une quantite minimum de mise en memoire 

20 d' informations d'etat de processeur en vue d'une 
restauration avec succes du programme. 

Dans un autre mode de realisation, la presente 
invention est un dispositif de calcul comprenant un 
premier processeur dans un environnement multi-tache pour 

25 executer des programmes presentant des ensembles 
respectifs de reperes de commutation de contexte 
intercales, et une premiere memoire, couplee au premier 
processeur, affectee au stockage des informations d'etat 
de processeur. Le dispositif de calcul comprend en outre 

30 une seconde memoire couplee au premier processeur, un 
detecteur de requete de commutation de contexte 
fonctionnant sur le premier processeur pour detecter, 
apres que le processeur rencontre l'un des reperes dans 
un programme d' execution, une requete pour commuter le 

35 contexte du programme, et un module de sauvegarde de 
contexte fonctionnant sur le premier processeur pour 
repondre a une requete de commutation de contexte 
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detectee en sauvegardant dans la seconde memoire les 
informations d'etat de processeur placees dans la 
premiere memoire. 

Diverses autres caracteristiques de 1' invention 
5 ressortent d'ailleurs de la description detaillee qui 
suit. 

Des formes de realisation de l'objet de 1' invention 
sont representees, a titre d'exemples non limitatifs, aux 
dessins annexes. 
10 La figure 1 est un schema synoptique de type evolue 

illustrant un systeme a multiprocesseurs multimedia 
conforme a un mode de realisation de la presente 
invention. 

La figure 2 est un schema synoptique montrant un 
15 processeur de signaux multimedia inclu dans le dispositif 
a multiprocesseurs multimedia illustre a la figure 1. 

La figure 3 est un schema synoptique montrant un 
coprocesseur du processeur de signaux multimedia illustre 
a la figure 2. 

20 La figure 4 est un schema synoptique montrant des 

chemins de donnees d' execution de coprocesseur du 
coprocesseur illustre a la figure 3. 

La figure 5 est un schema synoptique illustrant une 
architecture de micro-programmation du processeur de 

25 signaux multimedia. 

La figure 6 est un organigramme qui illustre des 
operations concernant une sauvegarde de contexte de 
programme efficace ainsi qu'une restauration de programme 
efficace dans une architecture a multiprocesseurs. 

30 La figure 7 est une illustration d'une partie d'un 

deroulement de programme pouvant etre execute et 
presentant des instructions de commutation conditionnelle 
de contexte intercalees. 

En se referant a la figure 1, un schema synoptique 

35 de type evolue illustre un dispositif a multiprocesseurs 
multimedia 100 comprenant un processeur central 102 et un 
processeur de signaux multimedia 200. Un processeur 
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central typique 102 est un processeur x86 tel qu'un 
processeur Pentium™ ou Pentium Pro™ d' Intel Corporation. 
Le processeur central 102 execute des programmes bases 
sur des instructions et des donnees maintenues 
5 principalement dans une memoire systeme 104 et une 
antememoire 105. Le processeur central 102 communique 
avec le processeur de signaux multimedia 200 par 
1 ' intermediate d'un jeu de puces PC 107 et d'un bus 
systeme 106, tel qu'un bus PCI. Le proceseur de signaux 

10 multimedia 200 fournit une interface pour divers blocs 
fonctionnels tels qu'un CODEC audio et de communication 
108 pour recevoir une communication audio et une 
communication telephonique, un convertisseur A/N video 
110 pour recevoir des signaux d'entree video, un 

15 convertisseur N/A video 112 pour emettre des signaux de 
sortie video, et une memoire tampon SDRAM de trame 114. 
Dans un mode de realisation, le processeur de signaux 
multimedia est l'un quelconque des processeurs de signaux 
multimedia de la famille MSP de Samsung Semiconducteur 

20 Inc (MSP de Samsung) . 

En se referant a la figure 2, un schema synoptique 
montre le processeur de signaux multimedia 200 du 
dispositif a multiprocesseurs multimedia 100 (figure 1). 
Le processeur de signaux multimedia 200 comprend une 

25 memoire centrale de processeur de signaux numeriques 
(PSN) 201 qui fournit une interface par 1 ' intermediaire 
d'un bus rapide (FBUS) 210 pour un ensemble de 
peripheriques FBUS comprenant, par exemple, une interface 
de bus PCI a 32 bits 222, un organe de commande de 

30 memoire SDRAM a 64 bits 226, un organe de commande DMA a 
8 canaux 220, un bloc logique ASIC 216, et un organe de 
deplacement de donnees memoire 224 pour deplacer des 
donnees entre le processeur central 102 et la memoire 
tampon SDRAM de trame 114. L' interface de bus PCI 222 

35 fournit une interface pour le bus systeme 106 et 
fonctionne, par exemple, a 33 MHz. Le bloc logique ASIC 
216 fournit une logique de commande pour mettre 
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eventuellement en oeuvre une f onctionnabilite adaptee au 
besoin particulier de 1 ■ utilisateur . Le bloc logique ASIC 
216, dans un mode de realisation, fournit 10 kiloportes 
comprenant des interfaces vers divers CODEC analogiques 
5 et dispositifs d" entree/sortie (E/S) specif iques aux 
utilisateurs . L'organe de deplacement de donnees memoire 
224 transfere des donnees DMA du processeur central 102 
vers la memoire SDRAM 114 qui est locale au processeur de 
signaux multimedia 200. La memoire centrale de PSN 201 

10 fournit egalement une interface par 1 ' intermediaire d'un 
bus E/S pour un ensemble de dispositifs a bus E/S 
comprenant, par exemple, un synchronisateur d'intervalle 
programmable ou rythmeur 228 a compatibilite 8254, une 
ligne serie UART 230 a compatibilite 16450, un organe de 

15 commande d' interruption programmable 232 a compatibilite 
8259, et un processeur de train de bits 234 pour traiter 
un train de bits video. Pour plus de renseignements 
concernant le processeur de train de bits 234 il y a lieu 
de se referer aux demandes de brevet US deposees le 19 

20 Aout 1996 sous les N° 08/699 303 et 699 382 au nom de C. 
Reader et al intitules "Methods and Apparatus for 
Processing Video Data" qui sont incorporees aux presentes 
par reference a leur texte complet. 

La memoire centrale de PSN 201 est le moteur de 

25 calcul du processeur de signaux multimedia 200 et 
comprend un processeur 202, un coprocesseur 204, un sous- 
systeme d ' antememoire 208, le bus rapide (FBUS) 210 et le 
bus E/S 212. Dans un mode de realisation, le proceseur 
202 est un processeur de commande RISC a 32 bits de type 

30 ARM7™ qui effectue des fonctions de traitement generales 
telles que des requetes d'autorisation de commutation de 
contexte, des operations de systeme de f onctionnement en 
temps reel, un traitement d' interruption et d* exception, 
une gestion de dispositifs entree/sortie, une 

35 communication avec le processeur central 102, et 
analogues. Dans un mode de realisation, le processeur 202 
fonctionne a 40 MHz. Le processeur 202 fournit une 
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interface pour le coprocesseur 204 par 1 ' intermediaire 
d'une interface de coprocesseur 206. 

Le processeur 202 effectue le traitement 
d' exceptions en reponse a des exceptions, en general des 
5 conditions qui se produisent au cours du traitement 
d 1 instructions, en provoquant une modification du 
deroulement de la commande d' execution. Pour plus de 
renseignements concernant le traitement d' exception, il y 
a lieu de se referer aux demandes de brevets US deposees 

10 aux noms de Song et al le 19 Aout 1996 l'une sous le 
N° 08/699 295, intitulee "System And Method For Handling 
Software Interrupts With Argument Passing", et 1' autre 
sous le N° 08/699 294, intitulee "System And Method For 
Handling Interrupt And Exception Events In An Asymmetric 

15 Multiprocessor Architecture", qui sont incorporees aux 
presentes par reference a leur texte complet. 

Le coprocesseur 204 est le moteur de traitement de 
signaux numeriques du processeur de signaux multimedia 
200. Dans un mode de realisation, le coprocesseur 204 est 

20 un processeur vectoriel de la famille MSP de Samsung. En 
tant que processeur vectoriel, le coprocesseur 204 
presente une architecture Instruction Unique-Donnees 
Multiples et comprend un moteur RISC pipeline qui 
fonctionne sur des elements de donnees multiples en 

25 parallele pour effectuer des fonctions de traitement de 
signaux telles que des Transformes de Cosinus Discretes 
(TCD) , un filtrage FIR, une convolution, une estimation 
de mouvement video et d'autres operations de traitement. 
Le coprocesseur 204 supporte une arithmetique vectorielle 

30 dans laquelle des elements de donnees multiples sont 
actionnes en parallele, a la maniere d'un processus 
vectoriel, par un ensemble d' unites d' execution 
vectorielles . Le coprocesseur 204 execute a la fois des 
operations scalaires et des operations vectorielles et 

35 scalaires combinees. Les elements de donnees multiples du 
coprocesseur 204 sont comprimes dans un vecteur a 576 
bits qui est calcule a un debit de trente deux operations 
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arithmetique a virgule fixe de 8/9 bits, seize operations 
arithmetiques a virgule fixe de 16 bits, ou huit 
operations arithmetiques a virgule fixe ou a virgule 
flottante par cycle (par exemple 12,5 ns) . La plupart des 
5 operations scalaires a 32 bits sont pipelinees a une 
cadence d'une instruction par cycle, tandis que la 
plupart des operations vectorielles a 576 bits sont 
pipelinees a une cadence d'une instruction en deux 
cycles. Les operations de charge et de mise en memoire 

10 presentent une simultaneity d' execution avec les 
operations arithmetiques et sont executees de maniere 
independante par des circuits separes de charge et de 
mise en memoire. 

En se referant a la figure 3, le coprocesseur 204 

15 presente quatre blocs fonctionnels comprenant une unite 
d' extraction d 1 instructions 302, un bloc decodeur et 
delivreur d' instructions 304, un chemin de donnees 
d' execution d' instructions 306 et une unite de charge et 
de mise en memoire 308. L' unite d' extraction 

20 d' instructions 302 et le bloc decodeur et delivreur 
d' instructions 304 sont inclus dans le coprocesseur 204 
pour permettre au coprocesseur 204 de fonctionner de 
maniere independante du processeur 202. 

L' unite d' extraction d 1 instructions 302 effectue 

25 une extraction prealable des instructions et traite les 
instructions de deroulement de commande telles que des 
instructions de Branchement et de Sauts vers Sous- 
programmes. L' unite d' extraction d ' instructions 302 
contient une file d'attente a 16 entrees d" instructions 

30 d" extraction prealable pour le train d' execution en cours 
et une file d'attente a huit entrees d' instructions 
d' extraction prealable pour le train de cible de 
Branchement. L' unite d' extraction d' instructions 302 
regoit, aux bornes d'un bus de largeur 256 bits, jusqu'a 

35 huit instructions provenant de 1 ' antememoire 
d' instructions dans un cycle. Le bloc decodeur et 
delivreur d " instructions 304 decode et organise toutes 
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les instructions executees par le coprocesseur 204. Le 
decodeur traite une instruction dans un cycle dans 
l'ordre de reception a partir de 1' unite d' extraction 
d' instructions 302, tandis que le delivreur organise la 
5 plupart des instructions en derangement dependant a la 
fois de la ressource d'excution et de la disponibilite 
des donnees d ' operandes . 

En se referant a la figure 4, le chemin de donnees 
d' execution d ' instructions 306 comprend un fichier 

10 registre a quatre entrees 402, huit multiplicateurs 
paralleles 32x32 404 et huit ALU a 36 bits 406. Le 
fichier registre 402 prend en charge deux operations de 
lecture et deux operations d ' enregistrement par cycle. 
Les multiplicateurs paralleles 404 produisent jusqu'a 

15 huit multiplications a 32 bits dans un format entier ou a 
virgule flottante, ou seize multiplications a 16 bits ou 
trente deux multiplications a 8 bits par cycle. Les ALU 
406 executent soit huit operations ALU a 36 bits dans un 
format entier ou a virgule flottante, seize operations 

20 ALU a 16 bits, ou trente deux operations a 8 bits par 
cycle (par exemple 12,5 ns). 

Le fichier registre 402 inclut un ensemble de 
registres specialises et un ensemble de registres 
d'adresses de retour. Les registres specialises 

25 comprennent un registre de commande vectorielle et d'etat 
(VCSR) , un compteur de programme vectoriel (VPC), un 
compteur de programme d'exception vectoriel (VEPC), un 
registre de sources d " interruption vectorielle (VISRC), 
un registre de synchronisation du processeur vectoriel et 

30 de commande (VASYNC) et d'autres registres tels que 
divers registres de comptage, de masquage, de depassement 
de capacite et de point de rupture. Le compteur de 
programme vectoriel (VPC) constitue l'adresse de 
1' instruction suivante a executer par le processeur 

35 vectoriel 204. 

Le registre de sources d' interruption vectorielle 
(VISRC) indique les sources d' interruption vers le 
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processeur 202. Des bits appropries du VISRC sont regies 
par le materiel lors de la detection d ' exceptions . Les 
bits sont remis a l'etat initial par le logiciel avant 
que reprenne 1' execution du coprocesseur 204. Tout bit 
5 regie dans le VISRC amene le coprocesseur 204 a entrer 
dans l'etat inactif (VP_IDLE) . Si le bit d' autorisation 
d' interruption correspondant est regie dans un registre 
VIMSK de 1" interface de coprocesseur 206, une 
interruption IRQ est signalee au processeur 202. 

10 Le coprocesseur 204 detecte des conditions 

d' exception, comprenant des exceptions precises et des 
exceptions imprecises. Les exceptions precises sont 
detectees par le coprocesseur 204 et rapportees avant 
1' instruction en defaut. Les exceptions precises 

15 comprennent une exception de point de rupture d'adresses 
d' instruction, une exception de point de rupture 
d'adresses de donnees, une exception d' instruction 
incorrect e, une exception d'un seul chemin, une exception 
de depassement de capacite d'empilage d'adresses de 

20 retour, une exception de depassement de capacite negative 
d'empilage d'adresses de retour, une exception VCINT, et 
une exception VCJOIN. Les exceptions imprecises du 
coprocesseur 204 sont detectees et rapportees apres 
1' execution d'un nombre variable d' instructions qui sont 

25 plus tard dans l'ordre programme de 1 ' instruction en 
defaut. Les exceptions imprecises comprennent une 
exception d'adresses d' instructions incorrectes, une 
exception d'adresses de donnees incorrectes, une 
exception d'acces de donnees non alignees, une exception 

30 de depassement de capacite entiere, une exception de 
depassement de capacite a virgule flottante, une 
exception d'operandes incorrectes a virgule flottante, 
une exception de division par zero a virgule flottante et 
une exception de division par zero entiere. 

35 Le registre d' instruction d' interruption 

vectorielle (VIINS) est mis a jour avec 1 ' instruction 
VCINT ou 1 ' instruction VCJOIN du coprocesseur lorsque 
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1 ' instruction est executee pour interrompre le processeur 
202. 

Le processeur 202 declenche les operations du 
coprocesseur 204. Pour davantage de renseignements 
5 concernant les operations de declenchement par le 
processeur 202 du coprocesseur 204, il y a lieu de se 
referer aux demandes de brevet US deposee le 19 Aout 
1996, la premiere sous le N° 08/699 295 et intitulee 
"System And Method For Handling Software Interrupts With 

10 Argument Passing" la seconde sous le N° 08/699 294 et 
intitulee "System And Method For Handling Interrupt And 
Exception Events In An Asymmetric Multiprocessor 
Architecture" ,toutes deux aux noms de Song et al, et dont 
1' ensemble est incorpore aux presentes a titre de 

15 reference. 

Le registre de masque d' interruption vectoriel 
(VIMSK) commande le rapport des exceptions se produisant 
a l'interieur du coprocesseur 204 vers le processeur 202. 
Les bits du VIMSK, lorsqu'ils sont regies en meme temps 

20 qu'un bit correspondant du registre de la source 
d' interruption vectorielle (VISRC), permet a l'exception 
d ' interrompre le processeur 202. Le registre VISRC 
comprend un ensemble de bits indiquant qu'elle est la 
source d'un ensemble d' exceptions et d' interruptions. Les 

25 bits du registre VIMSK comprennent une autorisation 
d" Interruption de Point de Rupture d'Adresses de Donnees 
(DABE), une autorisation d ' interruption de point de 
rupture d'adresses d' instructions (IABE) et une 
autorisation d ' interruption d'un seul chemin (SSTPE) . Le 

30 VIMSK commande en outre les bits d ' autorisation 
d' interruption de depassement de capacite (FOVE), 
d'operande incorrecte (FINVE) et de division par zero 
(FDIVE), a virgule flottante, ainsi que les bits 
d' autorisation d' interruption de depassement de capacite 

35 (IOVE) et de division par zero (IDIVE), entiere. Le VIMSK 
commande egalement une autorisation d" interruption du 



13 



2752966 



VCINT (VIE), une autorisation d' interruption du VCJOIN 
(VJE), une autorisation de commutation de contexte (CSE) . 

Le coprocesseur 204 agit en liaison avec le 
processeur 202 en envoyant des signaux au processeur 202. 
5 De maniere specif ique, le coprocesseur 204 envoie des 
signaux vers le processeur 202 de maniere indirecte par 
1 ' intermediaire de registres etendus d ' utilisateur 
indiquant que le coprocesseur 204 a execute une 
instruction de synchronisation. Le coprocesseur 203 

10 envoie egalement des signaux vers le processeur 202 par 
1 ' intermediaire d'une requete d 1 interruption indiquant 
que le coprocesseur 204 a arrete son execution et est 
entre dans l'etat VP_IDLE. Le coprocesseur 204 execute 
deux instructions pour envoyer des signaux au processeur 

15 202. Une instruction VCJOIN (VCJOIN n) se reunit de 
maniere conditionnelle au processeur 202 et amene le 
coprocesseur 204 a s'arreter et a entrer dans l'etat 
VP_IDLE. Un programme antagoniste (non illustre) du 
coprocesseur 204 adresse 1 ' instruction qui suit 

20 1' instruction VCJOIN. L" instruction VCJOIN, executee par 
le coprocesseur 204, est classee dans une classe de 
deroulement de commande. Les instructions de deroulement 
de commande comprennent diverses instructions 
conditionnelles telles que des instructions de 

25 branchement, de decrement et branchement, de saut, de 
retour de sous-programme, de commutation de contexte et 
de barriere. 

En se referant a nouveau a la figure 2, le sous- 
systeme d'antememoire 208 comprend une antememoire de 

30 donnees 236 (par exemple, 5 kilo-octets), une antememoire 
d' instructions 238 (par exemple, 2 kilo-octets) et une 
ROM d'antememoire 240 (par exemple, 16 kilo-octets) et 
fonctionne de maniere typique a la meme vitesse que le 
coprocesseur 204 (80 MHz). Dans un mode de realisation, 

35 le sous-systeme d'antememoire 208 comprend 1 kilo-octet 
de memoire d' instructions et 1 kilo-octet de memoire de 
donnees pour le processeur 202, 1 kilo-octet de memoire 
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d' instructions et 4 kilo-octets de memoire de donnees 
pour le coprocesseur 204, et le partage d'une ROM de 16 
kilo-octets d' antememoire d* instructions et de donnees 
integrees pour a la fois le processeur 202 et le 
5 coprocesseur 204. Le sous-systeme d ' antememoire 208 
fournit une interface pour le processeur 202 par 
1 1 intermediaire de bus de donnees a 32 bits et une 
interface pour le coprocesseur 204 par 1 ' intermediaire de 
bus de donnees a 128 bits. La ROM d ' antememoire 240 

10 comprend un logiciel d' initialisation de ^ROM, un 
logiciel de diagnostics d' auto-essai, divers logiciels de 
gestion systeme, des programmes de bibliotheque et une 
antememoire pour des constantes d ' instructions et de 
donnees choisies. De maniere specif ique, la ROM 

15 d' antememoire 240 comprend un organe de traitement 
d' exception d ' instructions et des organes de traitement 
d' interruption de dispositifs entree et sortie 0, 1, 2 et 
3 pour le processeur 202. La ROM d ' antememoire 240 
comprend egalement un organe de traitement d' interruption 

20 du processeur vectoriel et un organe de traitement 
d* exception de point de rupture du processeur vectoriel 
qui s'executent dans le processeur 202. 

En se referant a la figure 5, un schema synoptique 
illustre 1 "architecture de logiciel et de micro- 

25 programmation 500 du processeur de signaux multimedia 200 
comprenant un logiciel d' elements de systeme MSP 502 
s' executant sur le processeur de signaux multimedia 200 
et un logiciel de systeme d 1 application PC et de 
fonctionnement 508 s' executant sur le processeur central 

30 102. Le processeur de signaux multimedia 200 est commande 
par une microprogrammation comprenant une bibliotheque de 
microprogrammation a vecteur DSP 504 qui s' execute sur le 
coprocesseur 204 et un bloc de fonctions de gestion 
systeme 506 qui s' execute sur le processeur 202. La 

35 bibliotheque de microprogrammation a vecteur DSP 504 et 
le bloc de fonctions de gestion systeme 506 sont inclus 
dans le logiciel d' elements de systeme MSP 502. 



15 



2752966 



L 1 architecture 500 separe de maniere avantageuse la 
fonctionnalite de traitement des signaux des operations 
de commande d' application centrale pour simplifier le 
developpement du logiciel, ameliore la gestion de 
5 conception du logiciel et reduit les coiits de 
developpement et de maintenance des applications. 

Le logiciel d' elements de systeme MSP 502 s ' execute 
exclusivement sur le processeur 202 et comprend une 
partie residente de systeme de f onctionnement en temps 

10 reel MSP 510, un module de bibliotheque multimedia 512, 
le bloc de fonctions de gestion systeme 506 et la 
bibliotheque de microprogrammation a vecteur DSP 504. La 
partie residante en temps reel MSP 510, un sous ensemble 
de chez Microsoft Corp., de type MMOSA real time Kermel, 

15 est de maniere typique responsable de la fourniture d'une 
interface pour le processeur central 102, de la gestion 
des ressources, du traitement du dispositif E/S et de la 
plupart des traitements d ' interruption et d 1 exception. La 
partie residante en temps reel MSP 510 comprend un 

20 logiciel pour fournir une interface pour des logiciels 
Windows™ et Windows NT™ s' executant dans le processeur 
central 102. La partie residante en temps reel MSP 510 
comprend egalement un logiciel pour selectionner et 
decharger une microprogrammation d' application choisie a 

25 partir du processeur central 102, un logiciel pour 
organiser des taches pour etre executees dans le 
processeur 202 et dans le processeur vectoriel 204, et un 
logiciel pour la gestion de ressources systeme du 
processeur de signaux multimedia 200 comprenant des 

30 dispositif s memoire et E/S. La partie residante en temps 
reel MSP 510 comprend un logiciel pour synchroniser une 
communication entre des taches du processeur de signaux 
multimedia 200 et un logiciel pour rapporter des 
conditions d' interruption, d' exception et d'etat, reliees 

35 au MSP. 

La bibliotheque de microprogrammation a vecteur DPS 
504 effectue sensiblement toutes les fonctions de 
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traitements des signaux numeriques . La bibliotheque de 
microprogrammation a vecteur DPS 504 commande egalement 
des interruptions speciales specif iques telles qu'une 
Interruption de Co-processeur qui est delivree par le 
5 processeur 202 vers le processeur vectoriel 204, ou une 
Exception de Depassement de Capacite d'Empilage de 
Materiel, qui est creee a 1 ' interieur du processeur 
vectoriel 204. 

Le module de bibliotheque multimedia 512 effectue 

10 des fonctions de traitement de communications, y compris 
de communications de donnees, de communication, video et 
audio MPEG, de communications de codage et de synthese de 
parole, de communications audio compatibles SoundBlaster™ 
et analogues. La partie residante en temps reel MSP 510 

15 est un systeme de f onctionnement en temps reel, robuste, 
multitache, pre-vide, comprenant des perf ectionneraents 
qui facilitent 1' execution d' applications multimedia sur 
le processeur de signaux multimedia 200. 

Le logiciel d' applications PC et de systeme de 

20 f onctionnement 508 s' executant dans le processeur central 
102 commande le processeur de signaux multimedia 200 en 
lisant et en enregistrant des registres de commande et 
d'etat MSP par 1 1 intermediate du bus systeme 106, et en 
enregistrant dans des structures de donnees partagees 

25 celles qui sont residantes a la memoire systeme 104 et 
celles qui sont residantes au processeur multimedia 200. 

L' execution du programme MSP commence avec le 
processeur 202 qui execute un premier train d" execution. 
Le processeur 202 peut declencher un second train 

30 d' execution independant dans le processeur vectoriel 204. 
Les operations du processeur 202 et du processeur 
vectoriel 204 sont synchronises par 1 ' intermediate 
d' instructions de coprocesseur specif iques qui 
fonctionnent dans le processeur 202, comprenant des 

35 instructions STARTVP, INTVP et TESTVP, et des 
instructions speciales s' executant dans le processeur 
vectoriel 204, comprenant des instructions VJOIN et VINT. 
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Des transferts de donnees entre le processeur 202 et le 
processeur vectoriel 204 sont effectues en utilisant des 
instructions de deplacement de donnees executees dans le 
processeur 202. 

5 Le coprocesseur 204 agit en liaison avec le 

processeur 202 en envoyant des signaux vers le processeur 
202. De maniere specif ique, le coprocesseur 204 envoie 
des signaux vers le processeur 202 de maniere indirecte 
par 1 ' intermediaire de registres etendus d ' utilisateur 

10 indiquant que le coprocesseur 204 a execute une 
instruction de synchronisation. Le coprocesseur 204 
envoie egalement de maniere directe des signaux vers le 
processeur 202 par 1 ' intermediaire d'une requete 
d' interruption indiquant que le coprocesseur 204 a arrete 

15 son execution et a entre l'etat VP_IDLE. Le coprocesseur 
204 execute deux instructions pour appliquer des signaux 
au processeur 202, a savoir une instruction VCJOIN et une 
instruction VCINT, laquelle (VCINTn) interrompt de maniere 
conditionnelle le processeur 202, en amenant le 

20 coprocesseur 204 a s'arreter et a entrer dans l'etat 
VP_IDLE. Les instructions VCINT et VCJOIN sont des 
instructions executees par le coprocesseur 204 qui sont 
classees dans une classe de deroulement de commande. Les 
instructions de deroulement de commande comprennent 

25 diverses instructions conditionnelles telles que des 
instructions de branchement, de decrement et branchement, 
de saut, de retour de sous -programme, de commutation de 
contexte et de barriere. 

Le systeme a processeur multimedia 100 est decrit 

30 de maniere plus detaillee dans les demandes de brevet US 
deposees le 19 Aout 1996 sous les Nos 08/697 102 au nom 
de L. Nguyen, intitulee "Microprocessor Operation in a 
Multimedia Signal Processor", 08/699 597 au nom de L. 
Nguyen, intitulee "Single-Instruction-Multiple-Data 

35 Processing in a Multimedia Signal Processor", 08/697 086 
au nom L. Nguyen et al., intitulee "Single-Instruction- 
Multiple-Data Processing Using Multiple Banks of Vector 
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Registers", et 08/699 585 au nom de M. Mohamed et al . , 
intitulee "Single-Instruction-Multiple-Data Processing 
With Combined Scalar /Vector Operations", dont 1' ensemble 
est incorpore aux presentes a titre de reference. 
5 Le processeur de signaux multimedia 200 est capable 

de detecter des operations multitaches gui impliguent une 
execution successive de programmes. Le temps necessaire 
pour commuter de contexte entre des programmes peut etre 
reduit en diminuant la guantite des informations d'etat 

10 de processeur mis en memoire, par rapport a une mise en 
memoire de type traditionnel de toutes les informations 
d'etat de processeur, necessaires pour restaurer avec 
succes le programme en cours de commutation de contexte. 
En reduisant la guantite des informations de processeur 

15 mises en memoire au cours d'une commutation de contexte, 
les ressources peuvent etre utilisees de maniere plus 
efficace, comme indigue ci-dessous . 

La figure 6 illustre un mode de realisation d'un 
deroulement 600 de processus efficace de commutation de 

20 contexte et de restauration de programme (deroulement de 
processus de sauvegarde de contexte/restauration 600) gui 
est utilise a titre d'exemple par le systeme de 
processeur multimedia 100 et gui utilise notamment un 
processeur de signaux multimedia 200 choisi parmi l'un 

25 guelcongue des processeurs de signaux multimedia de la 
f ami lie MSP de Samsung. Le deroulement du processus de 
conservation de contexte/restauration 600 commence avec 
le bloc d' execution de programme 602. Dans le bloc 
d' execution de programme 602, le coprocesseur 204 

30 (figure 2) execute un programme, tel gu'un programme 
d' application. Le programme d 1 application comprend des 
reperes intercales par le programmeur dans tout le 
programme d 1 application de telle maniere gu'un repere 
soit rencontre sur une base approximativement reguliere. 

35 Dans ce mode de realisation, le repere est une 
instruction de commutation de contexte conditionnel du 
coprocesseur 204 appele VCCS. A un point guelcongue au 
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cours de 1' execution du programme d' application, le 
coprocesseur 204 comprend des informations d'etat de 
processeur associees a ce point du programme en cours 
d' execution. A certains points du programme 
5 d' application, moins d' informations d'etat de processeur 
sont necessaires pour restaurer avec succes le programme 
d 1 application a la suite d'une commutation de contexte 
qu'a d'autres points du programme d' application. Le 
programmeur, etant au courant de ces points "d'etat de 

10 processeur reduit" du programme d ' application qui 
necessitent de preference la preservation d'une quantite 
minimale d' informations d'etat de processeur au travers 
d'une commutation de contexte, place 1 ' instruction VCCS a 
ces points d'etat de processeur reduit du programme 

15 d' application. Cependant, l'intervalle entre des 
instructions VCCS rencontres devrait de preference ne pas 
etre tellement grand pour retarder de maniere notable une 
operation de commutation de contexte. L'intervalle 
dependra visiblement du jugement du programmeur, du 

20 programme d' application, et de la vitesse d'horloge du 
coprocesseur 204. Un intervalle pris a titre d'exemple 
resulte en un retard inferieur a 2 jL/sec entre une 
commutation de contexte requise et la reponse a la 
requete. 

25 La reduction de la quantite des informations d'etat 

de processeur necessaires pour reprendre avec succes un 
programme a la suite d'une commutation de contexte peut 
avoir pour resultat des gains appreciables de performance 
du processeur, notamment lorsque la dimension potentielle 

30 des informations d'etat du processeur est tres grand. Par 
exemple, l'un quelconque de la famille MSP de Samsung 
constitue une architecture prise a titre d'exemple 
presentant une quantite tres grande de zones de stockage 
en memoire allouee aux informations d'etat de processeur. 

35 Le MSP de Samsung comprend plus de sept (7) kilo-octets 
d' informations d'etat de processeur et comprend soixante 
quatre (64) registres vectoriels a deux cent quatre vingt 
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huit (288) bits, plus de quatre vingt (80) registres 
scalaires a trente deux (32) bits, et jusqu'a quatre (4) 
Kbytes de memoire de travail. Les augmentations de 
performance associees a la reduction de la quantite du 
5 trans fert des informations d'etat de processeur a la fois 
pendant une commutation de contexte et ensuite pendant la 
restauration du programme dans une architecture telle que 
le MSP de Samsung peuvent etre notables. 

Un exemple d'un point d'etat de processeur reduit 

10 dans un programme d' application comprend une instruction 
ADD qui determine la some de 50 arguments. Si le 
programme d 1 application est commute en contexte avant de 
determiner la somme des arguments, les informations 
d'etat de processeur necessaires pour restaurer ce 

15 programme d ' application doivent comprendre 1' ensemble des 
50 arguments. Cependant, si 1 ' instruction ADD est 
complete et que la somme est determined, seule la somme 
doit etre incluse en tant que partie des informations 
d'etat de processeur. Par consequent, la quantite des 

20 informations d'etat de processeur necessaires pour la 
reprise du programme lors d'un retour au programme est 
reduite par rapport a la sauvegarde de toutes les 
informations d'etat de processeur disponibles . 
L' instruction VCCS, qui constitue 1 ' instruction de 

25 commutation de contexte conditionnelle du coprocesseur 
204, est par consequent placee dans le programme 
d' application a un point qui suit la determination de la 
somme des 50 arguments. Ceci constitue un exemple d'un 
point approprie du programme d' application pour reduire 

30 les informations d'etat de processeur requises afin de 
commuter avec succes le contexte et restaurer le 
programme d' application. II apparaltra a l'homme du 
metier apres la lecture de cette description que de 
nombreux autres points des programmes d' application 

35 peuvent etre choisis pour reduire la quantite de mise en 
memoire d ' informations d'etat de processeur en prevision 
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de la commutation de contexte et de la restauration 
ulterieure d'un programme. 

En se referant a la figure 7, un segment 700 pris a 
titre d'exemple d'un programme d' application comprend des 
5 instructions VCCS intercalees 702. Les instructions VCCS 
702 sont en general intercalees de maniere reguliere a 
des emplacements predetermines requerant une quantite 
minimale de mise en memoire d' informations d'etat de 
processeur en prevision d'une commutation de contexte 

10 realisee avec succes et sans separation dans le programme 
d' application. 

En se referant a nouveau a la figure 6, au cours de 
1' execution du programme d' application dans le bloc 
d' execution de programme 6 02, une instruction VCCS de 

15 (32) bits sera rencontree au niveau du point approprie 
comme montre dans le bloc d' instructions de commutation 
de contexte 604. En continuant vers le bloc de requite de 
commutation de contexte 606, 1 ' instruction VCCS amene le 
coprocesseur 204 a determiner si le processeur 202 a ou 

20 non requis que le programme d' application en cours 
d' execution soit commute en contexte et remplace par un 
autre programme. Si une commutation de contexte n'a pas 
ete requise, le deroulement du processus de sauvegarde de 
contexte/restauration 600 revient au bloc d' execution de 

25 programme 602 et continue a executer le programme 
d' application en commengant au point qui suit 
1 ' instruction VCCS rencontree. 

De maniere a requerir une commutation de contexte, 
le processeur 202 enregistre un registre de masquage 

30 d' interruption de processeur vectoriel a trente deux (32) 
bits 208, appele registre VIMSK, place dans 1 ' interface 
de coprocesseur 206. De maniere specif ique, le processeur 
202 envoie le bit zero (0), qui constitue le bit CSE ou 
d'autorisation de commutation de contexte, du registre 

35 VIMSK 204 en enregistrant un (1) au bit CSE. Pour 
davantage de renseignements sur le registre VIMSK, voir 
les demandes de brevet US deposees le 19 Aout 1997 aux 
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noms de Song et al respectivement sous le N° 08/699 295 
et intitulee "System And Method For Handling Software 
Interrupts With Argument Passing" et sous le 
N° 08/699 294 et intitulee "System And Method For 
5 Handling Interrupt And Exception Events In An Asymmetric 
Multiprocessor Architecture." 

Le tableau 1 enonce le format de 1 ' instruction 
VCCS, utilise dans le processeur vectoriel MSP de 
Samsung. 

10 
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TABLEAU 1 




Le 


format 


de 


1 ' instruction VCCS comprend des 



111101 dans les positions des bits les plus signif icatif s 
et comprend une zone Decalee dans les vingt trois (23) 

15 bits les moins signif icatif s . La zone Decalee identifie 
un emplacement de sous -programme de sauvegarde de 
contexte auquel le coprocesseur 204 se branchera lors 
d'un achievement avec succes de 1 ' instruction DCCS si une 
commutation de contexte a ete requise. Les bits (25:23) 

20 ne sont pas utilises par 1 1 instruction VCCS. La syntaxe 
d'assembleur de 1 ■ instruction VCCS est VCCS #Decale. 

En se referant au bloc de requete de commutation de 
contexte 606, afin de determiner si le processeur 202 a 
ou non requis que le programme d' application en cours 

25 d" execution dans le bloc d' execution de programme 602 
soit commute en contexte et remplace par un autre 
programme, 1 1 instruction VCCS rencontree amene le 
coprocesseur 204 a lire le registre VIMSK 214. En 
supposant que 1 1 instruction VCCS n' amene pas une 

30 exception, si le bit CSE du registre VIMSK 214 est regie 
a un (1), l'adresse de retour du programme d 1 application 
du bloc d' execution de programme 602 est sauvegardee sur 
une pile d'adresses de retour temporaire associee de 
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maniere unique au programme en cours de commutation de 
contexte. L'adresse actuelle du programme d' application 
est placee dans le compteur de programme vectoriel (VPC) . 
L ' adresse de retour est egale a VPC plus quatre ( 4 ) . 
5 On notera que le coprocesseur 204 ne verifie pas 

une commutation de contexte requise a partir du 
processeur 202 jusqu'a ce qu'une instruction VCCS soit 
rencontree. II en resulte que le programmeur peut 
commander le point au niveau duquel un programme 

10 d' execution peut etre commute en contexte. En outre, bien 
qu'il puisse exister un retard entre une commutation de 
contexte requise et une reponse correspondante, aucune 
penal ite d' execution de programme n'est encourue du fait 
que le programme d ' application continue a s ' executer 

15 pendant toute requete de commutation de contexte, toute 
detection de commutation de contexte et tout retard de 
reponse de commutation de contexte. 

Le pseudocode suivant enonce le f onctionnement du 

VCCS : 

20 Si (VIMSK<CSE> == 1){ 

Si (VSP<4> 15) { 

VISRV<RAS0>=1 ; processeur de 

signaux 202 avec exception RASO ; 

VP_STATE = VP_IDLE ; 
25 }autrement{ 

RSTACK[VSP<3:0] = VPC + 4 ; 

VSP<4:0> = VSP<4:0> + 1 ; 

VPC = VPC + sex(Decale<22:0>*4) ; 

} 

30 }autrement VPC = VPC + 4 ; 

En se referant au bloc de requete de commutation de 
contexte 606 , 1 ' instruction VCCS amene ainsi le 
coprocesseur 204 a determiner si le bit CSE du registre 
VIMSK 214 est ou non regie. Si le bit n'est pas regie, le 

35 processeur 202 n'a pas requis une commutation de 
contexte, et le compteur de programme (VPC) du 
coprocesseur 204 est increments a 1 1 instruction suivante 
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et un retour est effectue au bloc d' execution de 
programme 602. Si le processeur 202 a requis une 
commutation de contexte, le coprocesseur 204 examine le 
bit quatre (4) du repere (VSP) de la pile vectorielle de 
5 cinq (5) bits associe au programme d ' application et 
determine si 1' execution de 1 • instruction VCCS aura pour 
resultat un debordement de capacite de la pile. Si un 
debordement de capacite de pile se produit, le bit 
d' exception de Debordement de Capacite de Pile d'Adresses 

10 de Retour du Registre de Source d' Interruption 
Vectorielle (VISRC) est regie a un (1), et l'etat (VP- 
STATE) du coprocesseur (204) est place dans un etat 
inactif (VP_IDLE) . Si un debordement de capacite de pile 
ne se produit pas, le deroulement du processus de 

15 sauvegarde de contexte/restauration 600 avance pour 
sauvegarder le bloc d'adresse de retour 608, et le 
coprocesseur 204 sauvegarde l'adresse de retour du 
programme d' application qui s' execute dans le bloc 
d' execution de programme 602 et incremente le repere de 

20 pile temporaire. VPC est alors charge avec l'adresse 
etendue du signe indiquee par la zone de Decalee VCCS. 
L'adresse maintenant stockee dans VPC est l'adresse du 
sous -programme de sauvegarde de contexte montree dans le 
bloc de sous -programme de sauvegarde de contexte 612. 

25 Le coprocesseur 204 se branche ensuite vers le 

sous -programme de sauvegarde de contexte en utilisant 
l'adresse de sous -programme de sauvegarde de contexte du 
VPC comme montree dans le branchement d' execution vers le 
bloc de sous-programme de sauvegarde de contexte 610. Le 

30 sous -programme de sauvegarde de contexte 612 est 
enregistre par le programmeur du programme d* application 
execute dans le bloc d' execution de programme 602. II en 
resulte que le programmeur est au courant de la quantite 
minimale d' informations d'etat de processeur qui doit 

35 necessairement etre mise en memoire afin de reprendre 
avec succes le programme d ' application a commutation de 
contexte. Comme montre dans le sous-bloc d ' informations 
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d'etat de processeur minimal de mise en memoire 614, le 
sous -programme de sauvegarde de contexte 612 ne 
sauvegarde que les informations requises presentes, par 
exemple, dans les registres et la memoire de travail, qui 
5 seront necessaire pour restaurer le programme a 
commutation de contexte. 

En avangant vers 1 ' emplacement de sauvegarde du 
sous-bloc 616 du sous -programme de restauration de 
contexte, le coprocesseur 204 termine le sous -programme 

10 de sauvegarde de contexte 612 en executant une 
instruction de tache de Liaison Conditionnelle de trente 
deux (32) avec le processeur 202, instruction appelee 
VCJOIN. Le Tableau 2 enonce le format de 1 ' instruction 
VCJOIN utilise dans le processeur vectoriel MSP de 

15 Samsung. 
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TABLEAU 2 




Le 


format 


de 


1 ' instruction VCJOIN inclut des 



100110 dans les positions des bits les plus signif icatif s 
20 et comprend une zone de condition dans les bits (25:23) 
et une zone Decalee dans les vingt trois (23) bits les 
moins signif icatif s . La zone de condition est reglee pour 
interrompre de maniere inconditionnelle le processeur 
202. La zone Decalee identifie une adresse d'un 
25 emplacement du sous -programme de restauration de contexte 
que le coprocesseur 204 executera lors de la reprise du 
programme a commutation de contexte. La syntaxe 
d'assembleur de 1 ' instruction VCJOIN est 

VCJOIN . cond#Decale . 
30 Le pseudocode suivant enonce le f onctionnement de 

VCJOIN : 

Si (Cond = in){ 

VISRC<VJP>==1 ; 
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VI INS = [Instruction CJOIN.condfDecale] ; 

VEPC = VPC ; 

Si (VIMSK<VJE>=1; interruption du 
processeur de signaux 202 ; 
5 VP_STATE=VP_IDLE ; 

} 

autrement VPC = VPC + 4 ; 

En se referant a 1 'emplacement de sauvegarde du 
sous-bloc 616 du sous-programme de restauration de 

10 contexte, 1" execution de 1 ' instruction VCJOIN.en #Decale 
par le coprocesseur 204 amene 1 ' emplacement du sous- 
programme de restauration de contexte 628 a etre conserve 
et interrompt le processeur 202 de sorte que le 
processeur 202 peut regler le coprocesseur 204 afin 

15 d'executer un programme ulterieur. Dans 1 ' emplacement de 
sauvegarde du sous-bloc 616 du sous -programme de 
restauration de contexte, la condition VCJOIN est reglee 
a inconditionnel, et un bit (VJE) d' Autorisation 
d* Interruption de VCJOIN du registre VIMSK 214 est 

20 egalement regie a (1). Le bit VJE est le bit cing (5) du 
registre VIMSK 214. En se referant a 1 ' emplacement de 
sauvegarde du sous-bloc 616 du sous-programme de 
restauration de contexte, la zone Decalee de vingt trois 
(23) bits de 1 ' instruction VCJOIN est reglee pour 

25 indiquer un emplacement du sous-programme de restauration 
de contexte 628. 

Lorsque 1 ' instruction CJOIN est executee par le 
coprocesseur 204 dans le sous-bloc 618 du processeur 
d' interruption, le coprocesseur 204 controle la zone de 

30 condition de 1 1 instruction VCJOIN pour verifier l'etat 
inconditionnel de la zone de condition. Ensuite, le 
coprocesseur 204 regie le bit d' exception en cours (VJP) 
du Registre de Source d' Interruption Vectorielle a trente 
deux (32) bits (VISRC) a un (1). Le bit VJP est le bit 

35 cinq (5) du registre VISRC. Un Registre d ■ Instructions 
d' Interruption Vectoriel 1 (VIINS) est mis a jour avec 
1' instruction VCJOIN car 1 ' instruction VCJOIN est en 
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cours d' execution afin d * interrompre le processeur 202. 
Le VPC en cours est mis en memoire dans un Compteur de 
Programme d" Exception Vectoriel (VEPC) . Le VEPC specif ie 
l'adresse de 1 ' instruction qui a le plus probablement 
5 cause 1' exception la plus recente. Comme 1' execution de 
1' instruction VCJOIN continue, le bit VJE du registre 
VIMSK 214 est evalue et determine pour etre regie a un 
(1). Le reglage du bit VJE amene une interruption IRQ du 
processeur 202, et le reglage du bit VJP amene le 

10 coprocesseur 204 a entrer dans l'etat IDLE. 

Le deroulement du processus de sauvegarde de 
contexte/restauration 600 deselectionne le bloc 612 du 
sous -programme de sauvegarde de contexte et avance vers 
le bloc 620 de 1 • organe de traitement d ' interruption de 

15 processeur. Le processeur 202 traite 1 ' interruption comme 
deer it dans les demandes de brevet US deposees le 19 Aout 
1996 aux noms de Song et al, d'une part sous le 
N° 08/699 295 et intitule "System And Method For Handling 
Software Interrupts With Argument Passing" et, d' autre 

20 part, sous le N° 08/699 294 et intitule "System And 
Method For Handling Interrupt And Exception Events In An 
Asymmetric Multiprocessor Architecture." 

Apres traitement de 1 ' interruption declenchee par 
VCJOIN, le processeur 202, comme montre dans le bloc 622 

25 de decision de commutation de contexte du programme 
suivant, determine si le programme suivant a executer est 
ou non un programme "nouveau", e'est-a-dire un programme 
dont le contexte n'a pas ete precedemment commute ou un 
programme dont le contexte a ete precedemment commute. Le 

30 systeme de f onctionnement (figure 5) du processeur de 
signaux multimedia 200 garde trace des programmes et du 
fait que leur contexte a ete ou non precedemment commute. 
Si le programme suivant a executer par le processeur 204 
est "nouveau", le deroulement du processus de sauvegarde 

35 de contexte/restauration 600 avance vers le coprocesseur 
configure de maniere a executer le bloc 624 du "nouveau" 
programme. Le processeur 202 configure le coprocesseur 
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204 pour executer le "nouveau" programme, et le 
deroulement du processus de sauvegarde de 
contexte/restauration 600 retourne vers le bloc 
d' execution de programme 602 ou est execute le "nouveau" 
5 programme . 

En revenant vers le bloc 622 de decision de 
commutation de contexte de programme suivant, le 
coprocesseur 204 entre le branchement vers le bloc de 
sous-programme de restauration de contexte 626 si le 

10 programme suivant a deja eu son contexte commute. Le 
processeur 202 charge alors VPC du coprocesseur 204 avec 
l'adresse du sous -programme de restauration de contexte 
628, lequel a ete sauvegarde pendant 1' execution de 
1' instruction VCJOIN dans 1 ' emplacement de sauvegarde du 

15 sous-bloc de sous-programme de restauration de contexte 
616 comme decrit ci-dessus, et le deroulement du 
processus de sauvegarde de contexte/restauration 600 se 
branche vers le sous -programme de restauration de 
contexte 628. 

20 Le sous -programme de restauration de contexte 628 

est enregistre par le programmeur du programme 
d' application dont le contexte est en train maintenant 
d'etre commute. II en resulte que le programmeur est au 
courant de 1 ' emplacement de la quantite minimale 

25 d' informations d'etat de processeur qui a ete 
precedemment mise en memoire par le sous -programme de 
sauvegarde de contexte 612 en prevision de la reprise 
avec succes de la commutation de contexte et du contexte 
maintenant commute dans le programme d' application. Le 

30 deroulement du processus de sauvegarde de 
contexte/restauration 600 avance pour charger le sous- 
bloc d' informations d'etat de processeur minimal 630 ou 
le coprocesseur 204 avance pour conduire la quantite 
minimale precedemment stockee des informations d'etat de 

35 processeur dans les emplacements memoire appropries du 
coprocesseur 204, par exemple dans les registres et la 
memoire de travail precedemment decrits . 
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Ayant charge les informations d'etat de processeur 
necessaires pour la reprise avec succes de la commutation 
de contexte dans le programme d" application, le sous- 
programme de restauration de contexte 628 prepare le 
5 coprocesseur 204 a executer le programme d ' application a 
commutation de contexte au niveau de 1 ' emplacement de 
programme precis qui a ete precedemment sauvegarde dans 
1' emplacement de sauvegarde du sous-bloc 616 du sous- 
programme de restauration de contexte. Afin de restaurer 

10 cet emplacement de programme d' application, le 
coprocesseur 204 execute une instruction de Retour 
Conditionnel De Sous -programme (VCRSR) qui termine le 
sous -programme de restauration de contexte 628. Le 
Tableau 3 enonce le format de 1 ' instruction VCJOIN qui 

15 est utilisee dans le processeur vectoriel MSP de Samsung. 
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TABLEAU 3 



Le format de 1 ' instruction VCRSR comprend les bits 
100101 dans les positions de bits les plus signif icatif s 

20 et comprend une zone de condition dans les bits (25:23). 
Les vingt trois (23) bits les moins signif icatif s ne sont 
pas utilises et peuvent etre regies a une valeur 
quelconque. La zone de condition est reglee pour 
interrompre de maniere inconditionnelle le processeur 

25 202. La synthaxe d'assembleur de 1 ' instruction VCRSR est 
VCRSR. cond. 

Le pseudocode suivant enonce le f onctionnement de 
1" instruction VCRSR : 
Si (Cond = in){ 
30 Si (VSP<4:0>==0){ 

VISRV<RASU>=1 ; 

processeur de signaux 202 avec 
exception RASU ; 
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VP_STATE = VP_IDLE ; 
}autrement{ 

VSP<4:0> = VSP<4:0> - 1 ; 

VPC = RSTACK[VSP<3:0>] ; 
5 VPC<l:0>=b'00 ; 

} 

}autrement VPC = VPC + 4 ; 

En se referant a l'adresse de retour de charge du 
bloc de programme a commutation de contexte 632, 

10 1" execution de 1 * instruction VCRSR.in amene le 
coprocesseur 204 a reprendre 1' execution de ce programme 
a commutation de contexte depuis 1 • emplacement 
precedemment mis en memoire dans le bloc d'adresses de 
retour de sauvegarde 608. Pendant 1' execution de 

15 1 'instruction VCRSR.in, le coprocesseur 204 determine 
qu'un branchement inconditionnel est requis en examinant 
la zone de condition de 1 1 instruction VCRSR qui contient 
un code de branchement inconditionnel. Le VSP examine du 
fait de 1* execution de 1 ' instruction VCRSR est un 

20 indicateur d'empilage temporaire qui est associe de 
maniere unique au programme en cours de commutation de 
contexte. Le coprocesseur 204 examine ensuite le VSP pour 
determiner si VSP est ou non en train de pointer vers son 
emplacement le moins signif icatif . Si le VSP est en train 

25 de pointer vers son emplacement le moins signif icatif , le 
bit RASU du registre VISRC est regie a un (1). Le bit 
RASU est le bit d' exception de Depassement de Capacite 
d'Empilage d'Adresse de Retour et, lorsqu'll est regie, 
il signale au processeur 202 qu'une exception existe, et 

30 le coprocesseur 204 entre dans l'etat inactif. Si le VSP 
n'est pas en train de pointer vers son emplacement le 
moins signif icatif , le coprocesseur 204 decremente le VSP 
de un (1) emplacement et charge le VPC avec l'adresse 
mise en memoire a cet emplacement VSP choisi. Cet 

35 emplacement du VSP contient l'adresse de retour 
prelablement mise en memoire dans le bloc d'adresses de 
retour de sauvegarde 608. Le pas VPC<1:0> = b'OO assure 
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que les deux (2) bits les moins slgnlf Icatif s du VPC sont 
charges avec des zeros . 

Apres que l'adresse de retour soit chargee dans le 
VPC, le deroulement du processus de commutation de 
5 contexte 600 retourne vers le bloc d' execution de 
programme 602 ou le programme maintenant a commutation de 
contexte commence son execution. Le deroulement du 
processus de commutation de contexte 600 se repete 
jusqu'a ce que 1* execution du programme soit terminee. 

10 Comme cela est evident d* apres ce qui precede, 

l'efficacite de la commutation de contexte dans un 
environnement a multiprocesseurs multitache est ameliore 
par le deroulement de processus de commutation de 
contexte 600. En sauvegardant seulement la quantite 

15 minimale d ' informations d'etat de processeur pendant la 
commutation de contexte d'un programme, un temps precieux 
du coprocesseur 204 peut etre utilise pour d'autres 
operations. En outre, le fait de restaurer seulement une 
quantite minimale d' informations d'etat de processeur 

20 permet a un programme d'etre efficacement a commutation 
de contexte. Ces economies de temps s'accumulent pendant 
que sont effectuees les operations de commutation de 
contexte . 

L 1 invention n'est pas limitee aux exemples de 
25 realisation representes et decrits en detail car diverses 
modifications peuvent y etre apportees sans sortir de son 
cadre. Par exemple, les realisations specif iques de 
materiel et de logiciel mentionnees constituent de 
simples exemples et de nombreuses autres architectures de 
30 systeme et/ou modes de realisation de logiciel peuvent 
mettre en oeuvre les caracteristiques de commutation de 
contexte et de restauration decrites ici. En outre, 
l'homme du metier comprendra, apres lecture de la 
description ci-dessus, que les caracteristiques de 
35 commutation de contexte et de restauration peuvent etre 
utilisees dans des environnements multitache impliquant 
plus de deux taches. 
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REVEND I CATIONS 



1. Procede caracterise en ce qu'il comprend les 
operations consistant a : 

executer un premier programme sur un premier 
processeur ; 

5 recevoir une requete de commutation de contexte en 

provenance d'un second processeur ; et 

repondre a la requete de commutation de contexte au 
niveau d'un point approprie du premier programme, ou le 
point approprie est associe a un repere du programme qui 
10 indique un point approche du premier programme requerant 
une quantite minimale de mise en memoire d' informations 
d'etat de processeur en vue d'une restauration avec 
succes du programme. 

2. Procede selon la revendication 1 caracterise en 
15 ce qu'il comprend en outre les operations consistant a : 

intercaler un ensemble de reperes dans le premier 
programme au niveau d " emplacements requerant une quantite 
minimale de mise en memoire d' informations d'etat de 
processeur pour une restauration avec succes du premier 
2 0 programme . 

3. Procede selon la revendication 1 caracterise en 
ce qu'il comprend en outre les operations consistant a : 

sauvegarder les informations d'etat de processeur 
correspondant a un etat du premier programme au niveau du 
25 point approprie ; 

commuter le premier programme ; 

executer un second programme sur le premier 
processeur ; 

commuter le second programme ; et 
30 restaurer le premier programme en utilisant la 

quantite minimale d' informations d'etat de processeur 
mises en memoire. 
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4 . Procede selon la revendication 1 caracterise en 
ce que 1 ' operation de reponse comprend les operations 
consistant a : 

sauvegarder les informations d'etat de processeur 
5 correspondant a un etat du premier programme au niveau 
d'un point approprie ; et 

sauvegarder 1 ' emplacement d'un programme de 
restauration de contexte pour restaurer sans separation 
le premier programme. 
10 5. Procede selon la revendication 1 caracterise en 

ce que 1" operation d' execution comprend une operation 
consistant a : 

executer le premier programme sur un processeur 
vectoriel d'un processeur de signaux multimedia dans un 
15 systeme a multiprocesseurs multimedia. 

6. Procede selon la revendication 1 caracterise en 
ce qu'il comprend en outre les operations consistant a : 

recevoir des donnees d'un ensemble de dispositifs 
multimedia ; et 

20 en ce que 1' operation d' execution comprend 

1' operation consistant a traiter les donnees recues . 

7 . Procede selon la revendication 1 caracterise en 
ce que 1' operation de reception comprend 1' operation 
consistant a : 

25 lire un registre presentant une zone d' autorisation 

de commutation de contexte reglee par le second 
processeur. 

8. Procede selon la revendication 1 caracterise en 
ce qu'il comprend en outre 1' operation consistant a : 

30 continuer d" executer le premier programme apres 

avoir recu la requete de commutation de contexte ; 

et en ce que 1' operation de reponse comprend les 
sous-operations consistant a : 

rencontrer le repere du premier programme au niveau 
35 du point approprie ; 

interrompre le premier processeur ; 
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lire la requete de commutation de contexte avec le 
premier processeur en reponse a la rencontre du repere du 
premier programme ; 

mettre en memoire une adresse de retour du premier 
5 programme ; 

mettre en memoire la quantite minimale 
d' informations d'etat de processeur requises pour 
restaurer avec succes le premier programme ; et 

notifier le second processeur de la capacite du 
10 premier processeur a executer le second programme. 

9. Procede selon la revendication 1 caracterise en 
ce que le repere est une instruction de commutation de 
contexte conditionnelle. 

10. Systeme de calcul caracterise en ce qu'il 
15 comprend : 

un premier processeur dans un environnement 
multitache pour executer des programmes presentant des 
ensembles respectifs de reperes de commutation de 
contexte intercales ; 
20 une premiere memoire, couplee au premier 

processeur, affectee a la mise en memoire des 
informations d'etat de processeur ; 

une seconde memoire couplee au premier processeur ; 

un detecteur de requete de commutation de contexte 
25 fonctionnant sur le premier processeur pour detecter, 
apres que le processeur rencontre un des reperes dans un 
programme d' execution, une requete de commutation de 
contexte du programme ; et 

un module de sauvegarde de contexte fonctionnant 
30 sur le premier processeur pour repondre a une requete de 
commutation de contexte detectee en sauvegardant , dans la 
seconde memoire, les informations d'etat de processeur 
placees dans la premiere memoire. 

11. Systeme de calcul selon la revendication 10 
35 caracterise en ce que le module de sauvegarde de contexte 

repond en outre a une commutation de contexte detectee en 
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sauvegardant un emplacement d'un module de restauration 
de contexte. 

12. Systeme de calcul selon la revendication 10 
caracterise en ce qu'il comprend en outre : 

5 un second processeur relie de maniere mutuelle au 

premier processeur, les premier et second processeurs 
presentant des caracteristiques asymetriques , le second 
processeur comprenant un mecanisme pour requerir que le 
premier processeur effectue une commutation de contexte 
10 d'un programme d' execution. 

13. Dispositif de calcul selon la revendication 12 
caracterise en ce qu'il comprend en outre : 

une unite d' interface couplee entre le premier et 
le second processeur, 1' unite d' interface comprenant un 
15 registre accessible de maniere mutuelle par les premier 
et second processeurs ; 

le second processeur etant capable d'enregistrer le 
registre afin d'indiquer une requete de commutation de 
contexte ; et 

20 le premier processeur etant capable de lire le 

registre pour detecter une requete de commutation de 
contexte provenant du second processeur. 

14. Systeme de calcul selon la revendication 12 
caracterise en ce que : 

25 le second processeur est un processeur de 

commande ; et 

le premier processeur est un processeur vectoriel. 

15. Dispositif de calcul selon la revendicatino 10 
caracterise en ce qu'il comprend en outre : 

30 un module de restauration de contexte fonctionnant 

sur le premier processeur pour restaurer un programme de 
commutation de contexte en ramenant vers la premiere 
memoire les informations d'etat de processeur 
sauvegardees placees dans la seconde memoire associee au 

35 programme a commutation de contexte. 

16. Systeme de calcul selon la revendication 1 
caracterise en ce que les reperes sont generalement 
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intercales de maniere reguliere dans tout le programme au 
niveau d ' emplacements qui necessitent un minimum 
d' informations d'etat de processeur pour restaurer avec 
succes le programme. 
5 17. Systeme de calcul selon la revendication 10 

caracterise en ce que les reperes sont des instructions 
de commutation de contexte conditionnel . 

18. Procede de sauvegarde de contexte efficace dans 
un environnement de systeme de calcul a multiprocesseurs 
10 multitache, comprenant les operations consistant a : 

inserer des instructions de commutation de contexte 
conditionnel dans un programme ; 

executer le programme ; 

recevoir une requete de commutation de contexte ; 
15 detecter une des instructions de commutation de 

contexte conditionnel ; 

determiner si la requete de commutation de contexte 
existe a partir d'un processeur a la suite de 1' operation 
de detection d'une des instructions de commutation de 
20 contexte conditionnel ; et 

commuter le programme comprenant les sous- 
operations consistant a : 

sauvegarder une adresse de retour du programme lors 
de la determination de 1 ' existence d'une requete de 
25 commutation de contexte, et autrement continuer 
d' executer le programme ; et 

executer un module de sauvegarde de contexte, 
comprenant les sous-operations consistant : 

mettre en memoire des informations d'etat de 
30 processeur correspondant a l'etat du programme avant la 
detection de 1 ' instruction de commutation de contexte 
conditionnel ; 

sauvegarder un emplacement du module de 
restauration de contexte ; et 
35 interrompre le processeur. 
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19. Procede selon la revendication 18 caracterise 
en ce qu'il comprend en outre les operations consistant 
a : 

commuter le programme comprenant les sous- 
5 operations consistant a : 

executer un module de restauration de contexte, 
comprenant les sous -operations consistant a : 

a) charger 1 ' information d'etat de processeur 
prealablement mise en memoire dans 1' operation 

10 d' execution de module de sauvegarde de contexte ; et 

b) charger le retour sauvegarde du programme 
prealablement sauvegarde dans 1' operation de commutation 
de programme ; et 

executer le programme. 
15 20. Procede selon la revendication 10 caracterise 

en ce qu'il comprend en outre les operations consistant 
a : 

executer le programme sur un coprocesseur ; et 
soumettre la requete de commutation de contexte 
20 provenant d'un processeur de commande a une unite 
d' interface . 

21. Procede selon la revendication 18 caracterise 
en ce que les instructions de commutation de contexte 
conditionnel dans un programme comprennent les operations 

25 consistant a : 

inserer les instructions de commutation de contexte 
conditionnel de maniere approximativement reguliere dans 
tout le programme de sorte que les instructions de 
commutation de contexte conditionnel sont inserees au 

30 niveau d ' emplacements du programme qui requierent une 
quantite minimale de preservation des informations d'etat 
de processeur en prevision de la commutation de contexte 
du programme. 

22. Procede selon la revendication 21 caracterise 
35 en ce que 1' operation d' insertion comprend en outre 

1' operation consistant a : 
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inserer les instructions de commutation de contexte 
conditionnel au niveau d ' intervalles approximativement 
reguliers de maniere que des retards notables soient 
evites entre les operations de reception de la requete de 
5 commutation de contexte et la detection d'une des 
instructions de commutation de contexte conditionnel. 

23. Procede selon la revendication 18 caracterise 
en ce que 1' execution d'une operation de programme 
comprend 1' execution du programme sur un premier 
10 processeur, le procede comprenant en outre 1' operation 
consistant : 

interrompre de maniere approximativement reguliere 
le premier processeur lors de la detection d'une des 
instructions de commutation de contexte conditionnel. 
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